12.下列选项中,适合批量采集网页公开数据的方法是
A.网络爬虫
B.手工录入
C.温度传感器
D.问卷调查
A. 网络爬虫
网络爬虫(Web Crawler)是一种自动化程序,通过模拟浏览器访问网页,按照规则批量抓取 HTML 内容、文本、图片等数据。其核心优势是可高效处理大量网页的重复采集任务(如电商价格监控、舆情分析),适合结构化或半结构化的公开数据采集,是批量获取网页数据的标准方案。
B. 手工录入
手工录入依赖人工复制粘贴数据,效率极低且易出错,仅适用于数据量极小的场景(如个别字段记录)。对于批量网页数据(如数千条商品信息),手工录入无法满足时效性和效率需求,该选项不符合题意。
C. 温度传感器
温度传感器用于监测环境温度(如机房、实验室),属于物理数据采集设备,与网页数据(文本、链接等)无关,明显不符合题意。
D. 问卷调查
问卷调查通过设计问题收集用户反馈(如满意度、偏好),属于主动获取主观数据的方式,而网页数据多为已公开的客观信息(如新闻内容、产品介绍)。问卷调查无法直接采集现有网页数据,该选项错误。
答案:A. 网络爬虫
1、下列选项中,最能直观呈现2025年热词的是 2025-07-01
2、下列选项中,属于自动采集数据的工具是 2025-07-01
3、在网络数据采集过程中,网络爬虫的主要作用是 2025-06-28
4、下列选项中,关于数据采集的说法正确的是 2025-06-28
5、下列选项中,能体现大数据“数据量大”的是 2025-06-28
6、下列选项中,属于大数据特征的是 2025-06-28
7、对采集的温度、湿度等记录分析后,得出了天气情况。以下说法正确的是 2025-06-28